零样本泛化

MDM

Matryoshka Diffusion Models (MDM) 是一种由苹果公司开发的新型扩散模型框架，通过嵌套UNet架构实现多分辨率联合去噪，支持从低分辨率到高分辨率的渐进式训练，显著提升高分辨率图像生成效率，适用于多种应用场景，如数字艺术创作、游戏开发、电影制作等，并具备出色的零样本泛化能力。

AI项目与工具 2025年06月12日 28 点赞 0 评论 658 浏览

BiGR

BiGR是一种基于二进制编码的条件图像生成模型，集成了生成与判别任务于同一框架，支持高质量图像生成、视觉辨别和编辑。它通过掩码建模机制和二进制转码器实现高效的图像重建与预测，无需针对特定任务进行结构修改或参数调整，适用于多种视觉任务，如艺术创作、内容生成、广告设计、图像修复等。

AI项目与工具 2025年06月12日 68 点赞 0 评论 905 浏览

The Matrix

The Matrix是一款基于AI的世界模拟器，能够生成高保真度、无限时长的视频流，支持实时交互控制。它融合了3A游戏数据与真实世界视频，具备零样本泛化能力。核心技术包括交互模块、移窗去噪过程模型和流一致性模型，适用于游戏开发、影视制作、虚拟现实、教育模拟及城市规划等多个领域。

AI项目与工具 2025年06月12日 51 点赞 0 评论 908 浏览

Aether

Aether是由上海AI Lab开发的生成式世界模型，基于合成数据训练，具备4D动态重建、动作条件视频预测和目标导向视觉规划等核心功能。它通过三维时空建模和多任务协同优化，实现对环境的精准感知与智能决策，具有出色的零样本泛化能力，适用于机器人导航、自动驾驶、虚拟现实等多个领域。

AI项目与工具 2025年06月11日 25 点赞 0 评论 895 浏览

DreamGen

DreamGen是英伟达推出的机器人学习技术，基于AI视频世界模型生成合成数据，使机器人能在梦境中学习新技能。它通过微调视频世界模型、生成虚拟数据、提取虚拟动作和训练下游策略四步流程，实现机器人在新环境中的行为和环境泛化。DreamGen无需大量真实数据，仅凭文本指令即可完成复杂任务，提升学习效率和泛化能力。其支持多种机器人系统和策略架构，适用于工业生产、家庭服务、医疗护理等多个领域。

AI项目与工具 2025年06月11日 35 点赞 0 评论 971 浏览

TrackVLA

TrackVLA是银河通用推出的端到端导航大模型，具备纯视觉环境感知、语言指令驱动、自主推理和零样本泛化能力。它能在复杂环境中自主导航、灵活避障，并根据自然语言指令识别和跟踪目标对象。无需提前建图，适用于多种场景，如陪伴服务、安防巡逻、物流配送等，为具身智能商业化提供支撑，推动机器人走向日常生活。

AI项目与工具 2025年06月11日 79 点赞 0 评论 890 浏览

零样本泛化

首页

零样本泛化

列表

默认

浏览次数

发布日期

MDM